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摘 要 :交通 预测 在 城市 管理 及 交通 规划 中 具有 重要 意义 。 然 而 ,在 交通 预测 任务 中 ,对 复杂 动态 时 空 依赖 关系 的 建 模 仍 
然 具 有 极 大 的 挑战 性 。 针 对 以 往复 杂 的 神经 网 络 构架 在 空间 维度 上 所 采用 的 预定 义 图 结构 未 包含 完整 交通 数据 空间 信 
息 , 且 在 时 间 维 度 上 不 能 很 好 地 捕获 交通 数据 长 期 依赖 关系 的 问题 ,提出 一 种 新 的 时 空 图 神经 网 络 。 通 过 自 适应 图 卷 积 区 
络 (AGCN) 自 动 捕获 节点 的 特定 状态 以 及 自动 推断 不 同 节点 之 间 的 相互 依赖 关系 ,提取 更 完整 的 交通 数据 空间 特征 ,再 通 
时空 长 短期 记忆 网 络 (ST-LSTMD) 中 的 时 间 记 忆 模 块 来 提取 交通 数据 的 时 间 特 征 ,捕获 短 中 长 期 的 时 间 依 赖 关 系 。 在 
MSD4 和 PeMSD8 数据 集 上 进行 了 验证 ,实验 结果 表明 ,所 提 网 络 相 比 基 线 模型 能 够 更 好 地 提升 交通 预测 性 能 
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stract; Traffic forecasting is of great significance in urban management and traffic planning. However, in the task of traf- 


prediction, the modeling of complex dynamic spatio-temporal dependence is still a great challenge. For the problem that 
the neural network can't capture the long-term traffic information in the spatial dimension, the new neural network structure 


.'Droposed in the past can't capture the complex traffic data in the spatial dimension. Through adaptive graph convolutional 


D 


network, the specific state of nodes is automatically captured and the interdependence between different nodes is automatical- 
ly inferred to extract the complete spatial features of traffic data. Then. the time characteristics of traffic data are captured 
by the time memory module in the spatio-temporal short-term memory network, and the short, medium and long-term time 
dependence is simulated. 

Key words: traffic forecast; adaptive graph convolution network; spatio-temporal correlation; spatio-temporal graph neural 


network; long-short term memory network 


城市 化 发 展 对 城市 交通 的 流通 性 和 可 持续 性 ， 交通 管理 中 起 着 至 关 重 要 的 作用 ,提高 了 智能 交通 


带 来 了 巨大 挑战 ,有 效 解决 交通 问题 的 智能 交通 系 
统 (ITS) 世 是 目前 被 广泛 关注 的 研究 领 
测 作为 智能 交通 系统 的 一 个 重要 组 成 部 分 ,不 仅 为 


系统 的 决策 效率 ”。 交 通 预 测 任务 的 实现 同时 也 
UR. CEM ，” 离 不 开 数据 处 理 . 计 算 机 算法 、 网 络 优化 等 技术 的 
支撑 。 因 此 ,探索 高 效 、 实 用 的 交通 预测 方法 不 仅 


城市 交通 规划 提供 科学 依据 ,还 在 城市 交通 调度 和 能 促进 多 学 科 之 间 的 交叉 应 用 和 发 展 ,而 且 也 成 了 
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相关 研究 领域 的 热门 研究 对 象 ,在 实际 应 用 中 具有 
非常 重要 的 现实 意义 局] 。 

交通 预测 是 时 空 预测 中 的 一 个 典型 研究 问题 ,其 
中 交通 数据 存在 着 复杂 的 时 空 相关 性 ,这 使 得 交通 预 
测 任务 非常 具有 挑战 性 ,例如 ,预测 交叉 路 口 未 来 某 
时 刻 的 交通 状况 (交通 流量 ,交通 速度 和 道路 占用 率 
等 ) 。 通 常 根据 预测 时 间 的 长 得, 交通 预测 任务 可 分 
为 短期 预测 (5 一 30 min) 和 中 长 期 预测 (30 一 60 
min) 中。 在 时 间 维 度 上 ,一 条 道路 此 刻 的 交通 状况 
可 能 在 不 久 的 将 来 影响 该 条 道路 或 者 其 他 道路 的 交 
通 状 况 。 在 空间 维度 上 ,不 同道 路 之 间 的 交通 状况 可 
能 会 相互 影响 。 因 此 ,研究 人 员 对 捕获 交通 数据 时 空 
相关 性 方面 进行 了 广泛 研究 。 传 统 方法 通过 部 署 时 
间 序 列 模 型 进行 交通 预测 , 如 向 量 自 回归 模型 
(VAR)™ 、 自 回归 集成 移动 平均 模型 (CARIMA)™、 
已 全 曼 滤波 中 等 。 然 而 ,这 些 方法 依赖 于 理想 的 平稳 
候选, 无 法 捕捉 真实 交通 动态 中 大 规模 交通 数据 之 间 
的 斐 线性 或 者 复杂 的 时 空 相关 性 。 近 年 来 ,研究 人 员 
转向 于 研究 基于 深度 学 习 的 方法 ,通过 设计 新 的 神经 
网 络 构架 来 捕捉 交通 数据 的 时 空 相关 性 ,以 弥补 传统 
亨 绰 的 不 足 , 如 用 于 捕获 时 间 依 赖 性 的 循环 神经 网 络 
(RNN) 呈 及 其 变 体 (长 短期 记忆 网 络 CLSTM) 和 门 
TESTE (GRU) ) 或 一 维 卷 积 神经 网 络 , 与 用 于 
捕 效 空间 依赖 性 的 卷 积 神经 网 络 (CNN) 上 相 结合 3 
共同 捕获 交通 数据 的 时 空 相关 性 。 但 这 些 方式 通常 
骨 周 于 欧 几 里 德 数据 ,如 图 像 、 网 格 等 ,在 具有 非 
欧 呢 里 德 结构 的 交通 网 络 上 仍 存在 局 限 性 。 于 是 ,为 
了 痪 服 上 述 局 限 , 捕 获 网 络 结构 特征 的 图 卷 积 网 络 
(GGN)5 得 到 了 迅速 发 展 。 在 图 卷 积 网 络 中 ,交通 
网 颖 被 建 模 成 图 结构 ,图 中 的 节点 表示 交通 传感器 ， 
边 表示 传感器 之 间 的 连通 性 , 边 权 值 表示 传感器 之 间 
BUEKECERES, DCRNN''”! STGCN , ASTGCN"" , 
T-GCND5 等 模型 通过 图 神经 网 络 来 捕获 交通 数据 的 
空间 依赖 性 ,并 通过 循环 神经 网 络 或 卷 积 神经 网 络 来 
捕获 时 间 依 赖 性 。 这 些 方法 在 一 定 程度 上 提高 了 交 
通 预 测 的 精度 ,但 却 存在 以 下 问题 :1) 这 些 方法 采用 
预定 义 的 图 结构 59 ,而 预定 义 的 图 结构 未 包含 完整 
的 空间 依赖 信息 ,例如 由 于 交通 数据 在 采集 过 程 中 的 
连接 不 完整 ,使 部 分 节点 缺少 真正 的 关联 ;2) 网 络 模 
型 参数 空间 共享 ,而 不 同道 路 的 交通 状况 不 同 ,共享 
参数 空间 使 得 模型 无 法 很 好 地 捕捉 细 粒 度 的 特定 交 
通 状况 (如 某 段 道路 封闭 或 者 发 生 事故 );3) 短 期 预测 
与 长 期 预测 的 性 能 相差 较 大 ,不 能 很 好 地 进行 长 期 预 
测 。AGCRN 通 过 自 适应 图 卷 积 网 络 (AGCN ) 与 
GRU 相 结合 的 方式 来 解决 空间 维度 上 使 用 预定 义 图 
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结构 以 及 共享 参数 空间 所 带 来 的 问题 ,但 其 在 时 间 维 
度 上 并 不 能 很 好 地 处 理 长 序列 , 即 在 长 期 预测 方面 稍 
有 欠缺 。 

针对 上 述 问 题 ,设计 了 一 种 用 于 交通 预测 的 自 适 
应 时 空 图 神经 网 络 , 主 要 工作 概括 为 利用 包含 自 适 应 
邻接 矩阵 和 自 适应 节点 参数 的 空间 卷 积 模块 提取 空 
间 特 征 。 自 适应 邻接 矩阵 自动 学 习 节 点 间 的 相互 依 
赖 关 系 ,捕捉 数据 中 隐藏 的 空间 关系 , 自 适应 节点 参 
数 根据 节点 般 入 从 所 有 节点 共享 的 权重 和 偏差 中 生 
成 ,以 捕获 特定 节点 模式 ;采用 时 空 长 短期 记忆 网 络 
(ST-LSTM) 器 中 时 间 记 忆 模 块 来 捕获 时 间 特 征 , 增 
强 长 序列 处 理 能 力 ; 在 2 个 公开 的 PeMSD4、 
PeMSD8 交通 流量 数据 集 上 ,与 多 个 基线 模型 进行 对 
比 验证 ,实验 结果 表明 ,本 模型 能 够 更 好 地 捕获 交通 
数据 时 空 相关 性 。。 


1 网 络 模型 


1.1 交通 预测 问题 


在 交通 流 预 测 任务 中 ,通过 历史 流量 数据 对 未 来 
某 时 段 内 的 交通 流量 进行 多 步 预测 。 交 通 流量 指 固 
定时 段 内 道路 某 位 置 通过 的 车 辆 数 , 作 为 交通 数据 特 
征 之 一 ,是 控制 车 流 和 道路 规划 的 重要 指标 "中 。 历 
史 交 通 数据 可 表示 为 交通 网 络 上 的 时 间 序 列 。 交 通 
网 络 可 用 图 的 形式 表示 : G=(V.E.A).V 为 图 中 的 
节点 集合 , 即 路 网 中 的 传感器 , E 为 节点 间 边 的 集 
合 , 反 映 了 传感器 所 在 道路 间 的 连通 性 , A € RV^ 
为 图 G 的 邻接 矩阵 , 当 节 点 v;,v; € V HI Gv; vj? 
E 五 时 ,邻接 矩阵 4A 中 的 元 素 A; —1. 否则 为 0。 每 
个 时 间 步 长 1, 图 G 都 有 一 个 表示 节点 属性 的 特征 矩 
MX? € RV, 即 图 信和 号。 给 定 图 G 和 历史 时 间 步 
长 为 S 的 图 信号 ,交通 预测 问题 可 表示 为 通过 学 习 
一 个 映射 函数 f£. 预测 未 来 工 步 长 的 交通 流量 ,映射 
关系 为 


> eu : G@+T) eU id iG], 
其 中 ， xe id € ROPS xe : GFT] E RSS 


1.2 空间 卷 积 模块 


空间 卷 积 模块 为 自 适应 图 卷 积 网 络 ,主要 包括 日 
适应 邻接 矩阵 和 自 适 应 节点 参数 。 其 中 自 适应 邻接 
和 矩阵 通过 自动 学 习 节 点 间 的 相互 依赖 关系 来 捕捉 交 
通 数 据 中 隐藏 的 空间 关系 ; 自 适应 节点 参数 从 所 有 证 
点 共享 的 权重 池 和 偏 置 中 生成 ,以 捕获 特定 节点 模 
式 。 二 者 相 结 合 构 成 的 自 适应 图 卷 积 网 络 能 够 获取 
数据 更 完整 的 空间 特征 。 
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1.2.1 自 适 应 邻接 抵 阵 

预定 义 的 图 结构 未 包含 完整 的 空间 依赖 性 信息 ， 
这 可 能 会 导致 预测 结果 出 现 偏 差 , 而 自 适应 邻接 矩阵 
无 需 任何 先 验 知识 ,能 从 输入 数据 中 自动 推断 出 隐藏 
的 空间 依赖 关系 ,借鉴 文献 [17] 中 提取 空间 特征 的 思 
路 来 捕获 交通 流 数 据 完 整 的 空间 相关 性 。 对 自 适应 
邻接 矩阵 部 分 ,首先 ,为 所 有 节点 随机 初始 化 一 个 可 
“eA SA TEE, CR ^". BEBE, ELO 
推断 每 对 节点 之 间 空 间 依赖 关系 。 因 此 , 归 一 化 后 的 
自 适应 邻接 和 矩阵 可 表示 为 


A =D AD^ = Softmax(ReLU(E, * E12). 
其 中 : E, Wye AAAs N 为 节点 数 ; 
Fe 为 节点 艇 入 的 维度 ; 度 和 矩阵 D €. RV Ox fat 
(APA € RV 为 图 的 邻接 矩阵 ; ReLU 为 激活 函数 ， 
Sgfymax 函数 对 自 适应 邻接 矩阵 进行 归 一 化 。 在 模 
型 训练 过 程 中 , E, 通过 自动 更 新 来 学 习 不 同 流量 序列 
之 闻 的 隐藏 依 赖 关系 ,同时 获得 图 卷 积 的 邻接 关系 。 
C2)2 自 适应 节点 参数 

> 在 交通 网 络 中 , 仅 捕获 节点 间 的 共享 模式 对 于 交 
通 预 测 是 不 够 准确 的 。 因 为 路 网 结构 中 2 个 相 邻 节 
点 的 特征 可 能 由 于 其 特定 属性 ,如 天 气 、 事 故 等 ,而 在 
菜 作 特定 时 间 段 呈现 不 同 的 交通 情况 ,或 者 2 个 不 相 
邻 早点 的 特征 呈现 相反 的 情况 。 因 此 ,有 必要 为 每 个 
节 碟 设 定 独立 的 参数 空间 来 学 习 特 定 节点 模式 。 一 
MERI E BUR 24 CGCND RARA Z= Uy 十 
DC^AD "X0 +b, JEP: X ERY 为 输入 ; COS 
特征 数 ; Z € RYT 为 输出 ;下 为 输出 维度 ; @ € RC" 
和 (DE RF 分 别 为 可 学 习 的 权重 和 偏差 。 对 自 适应 节 
点 参数 部 分 ,分 别 定义 一 个 节点 内 入 矩阵 柜 e € RY 
和 权重 池 We € ROOF, f HRA AP «Ne 
O =E; + We. 该 过 程 可 看 作 从 所 有 流量 序列 的 一 组 
候选 模式 中 学 习 节 点 特定 模式 , 即 节点 说 入 EG 从 大 
型 共享 权重 池 We 中 获取 节点 i 的 参数 b 的 操作 
相同 。 采 用 自 适应 节点 参数 的 GCN 公式 : 


Z=Uy+D :AD :XEW, + Echo, 
1.3 时 间 卷 积 模块 


时 间 特 征 的 提取 采用 时 空 长 短期 记忆 网 络 (ST- 
LSTM)""*! 的 时 间 记 忆 模 块 。 通 过 卷 积 层 取代 
LSTM 中 各 个 门 的 线性 操作 ,类 似 于 ConvLSTM, 这 
种 时 间 特 征 提取 方式 能 更 好 地 处 理 非 线性 的 时 空 序 
列 数据 ,解决 梯度 消失 /爆炸 问题 ,增强 长 序列 处 理 能 
Jj ,提高 模型 长 期 预测 性 能 。 
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e HITIGATV p3 IFRA II 
g, =tanh(W,, * X, Wre * Hia b). 
i, =o(W,, * X, -W,* Hi, b), 
f; =0 Was * X, -W,; * Hia db), 
C; -—f,9CL. d iE 
0, =0 (W, * LX, ;H' 43C A D. 

H! =o, ©tanhW),., * [Ci ;A D, 
其 中 : ci Ae 时刻/ 层 的 时 间 信 息 记 忆 单 元 ;gi 为 
输入 门 ,选择 性 记录 新 信息 到 记忆 单元 ; f, 为 遗忘 
门 , 根 据 数 据 特征 的 重要 性 选择 前 一 时 刻 记忆 单元 
CL. 中 的 关键 信息 保留 至 当前 记忆 单元 Ci io, 为 输 
出 门 ,输出 所 需要 的 信息 ; H, 为 1 时刻: 层 的 输出 信 
息 ; * 为 卷 积 操作 ;为 哈达 玛 积 ;A 为 自 适 应 图 卷 积 
捕获 的 空间 特征 信息 。 

1.4 模型 框架 


自 适 应 图 卷 积 长 短期 记忆 网 络 模型 (AGC- 
LSTM) 如 图 1 所 示 , AGCN 模块 进行 空间 特征 的 提 
Wi. M; Ae WAIL 层 的 空间 信息 记忆 单元 。 将 时 间 
记忆 和 空间 记忆 使 用 共享 的 输出 门 o, 实现 了 无 缝 
记忆 融合 ,可 有 效 地 对 时 空 序列 数据 的 变化 进行 
模 。 整 个 网 络 模型 可 表示 为 

g, =tanh(W,, * X, FW, * HA +b,), 

i, 2o(W,; * X, +W,, *H' ab), 
fi =0W,, * X, -W,,* Hi, b, 
Ci =f OCh +1,02,> 


A —Softmax( ReLUCE, * E12). 


M! =A [ X; M! ! JEW,,, + Eb nn > 

o, =0 (W, * [X,;H i1 ;C1;M; D, 

Hi =0,©tanh(Wix * [C'; MI D, 
iB MESS E E AGC-LSTM ,捕获 特定 节点 的 时 
空 模式 ,实现 多 步 流 量 预测 , 即 输 入 历史 数据 H C 
RY”, 通过 网 络 模型 将 RA" 映射 到 RY 来 直接 获 
得 所 有 节点 未 来 + 步 长 的 交通 流量 。 采 用 L1 aK P 

数 作为 模型 训练 目标 ， 


i=t}r 


LW, = |Ix,;—Y.l-. 


其 中 ;W, 为 网 络 中 所 有 可 训练 的 参数 ; X. € RY 
为 第 i 个 时 间 步 的 真实 值 ;Y..; € RV? 为 第 i 个 样本 
的 预测 值 。 


2 实验 探究 


2.1 实验 设置 


为 了 验证 所 提 模 型 的 优越 性 ,在 PeMSDAU 和 


1 AGC-LSTM ; 


1 网 络 模型 AGC-LSTM 


PeMSD85 数据 集 上 进行 实验 验证 。PeMSD4 数据 
集 收 集 了 2018 年 1 月 1 日 至 2018 年 2 月 28 日 昌 人 金 
山 湾 区 307 个 交通 监测 器 所 监测 的 交通 流量 信息 ， 
PeMSDS 数据 集 收 集 了 2016 年 7 月 1 日 至 2016 年 8 
H-31 日 圣 贝 纳 迪 诺 地 区 170 个 环 路 探测 器 收集 的 交 


准 明 一 化 方式 对 数据 集 进行 归 一 化 处 理 ,使 训练 过 程 
更 前 稳定 。 在 2 个 数据 集 上 均 使 用 12 步 长 (历史 时 
p 长 为 10 的 历史 数据 ,预测 未 来 12 步 长 的 交通 
流量 信息 。 数 据 集 划 分 为 6:2:2 的 训练 集 ,验证 集 和 
RA. 采用 Adam 优化 器 进行 优化 ,Adam 优化 器 
rex. 对 内 存 需 求 少 ,很 适合 应 用 于 大 规模 数据 
及 参数 的 场景 。 3 ARR BEN 100, bitch size 大 小 为 
台 学 习 率 为 0.001, 并 使 用 patience 为 15 AY 


tror 法 。 
表 1 数据 集 统 计 信 息 


+ Nodes + Edges + Time Steps 
PeMSD4 307 340 16 992 
PeMSD8 107 241 17 856 


2.2 评估 指标 和 基线 


采用 3 个 被 广泛 使 用 于 交通 预测 任务 中 的 评估 

虽 标 来 衡量 不 同 对 比 模型 的 性 能 ,分 别 为 平均 绝对 误 

差 (MAE) . 均 方 根 误差 (RMSE) 和 平均 绝对 百分比 
误差 (MAPE)， 


N 
MAE-X 2) IX.a d (19) 


RMSE = a ae (20) 


MAPE = Yun o 


(21) 


Ux. 
MAE, RMSE fll MAPE " 标 用 于 测量 预测 误差 , 误 


En i iT 
差 越 小 ,表明 预测 性 能 越 好 。 
2.3 实验 结果 


不 同方 法 在 12 个 步 长 预测 区 间 内 的 总 体 性 能 比 
较 结果 如 表 2 所 示 。 从 表 2 可 看 出 ,模型 AGC- 
LSTM 在 PeMSD4 和 PeMSD8 两 个 数据 集 上 均 获 得 
了 良好 效果 。 与 VAR 和 SVR 等 传统 机 器 学 习 方 法 
相 比 ,AGC-LSTM 的 预测 性 能 有 了 大 幅度 提升 ,其 
在 2 个 数据 集 上 的 表现 均 较 传统 方法 更 好 ,说 明 使 用 
时 空 图 神经 网 络 的 模型 能 更 好 地 处 理 时 空 序 列 数据 。 
与 LSTM 方法 相 比 ,AGC-LSTM 同样 具有 更 好 的 预 
测 性 能 , 且 性 能 提升 较 大 ,说 明 相 较 于 一 般 的 卷 积 神 
经 网 络 ,AGC-LSTM 捕获 数据 时 空 相关 性 的 能 力 更 
强 。 在 同样 使 用 时 空 图 神经 网 络 的 方法 中 , AGC- 
LSTM 5 ASTGCN 相 比 ,在 PeMSD4 数据 集 上 ， 
MAE 降低 了 3. 995. 7E PeMSD8 数据 集 上 ,MAE 降 
低 了 1.75%; 与 STSGCN 相 比 ,在 PeMSD4 数据 集 
上 ,MAE 降低 了 1.24%, 在 PeMSD8 数据 集 上 ， 
MAE 降低 了 1.07%。 这 充分 说 明 与 使 用 预定 义 图 
结构 的 模型 相 比 , AGC-LSTM 能 更 好 地 捕获 交通 数 
据 的 时 空 相 关 性 。 与 同样 使 用 自 适应 图 卷 积 网 络 
(AGCN) 的 AGRCN 相 比 ,AGC-LSTM 的 3 个 误差 
值 都 更 小 ,说 明 其 捕获 交通 数据 时 间 依 赖 性 的 能 
更 强 。 


#2 PeMSD4 和 PeMSD8 数据 集 上 不 同方 法 
在 12 步 长 预测 区 间 内 的 平均 性 能 比较 


PeMSD4 PeMSD8 
模型 
MAE RMSE MAPE/% MAE RMSE MAPE/% 
VAR 24.54 38.61 17. 24 19.19 29.81 13.10 
SVR 28.70 44.56 19. 20 28.70 36.16 14.64 
LSTM 27.14 41.59 18. 20 23.25 34.06 14.20 


DCRNN 21.22 33.44 14. 17 16.82 26.36 10.92 
STGCN 21.16 34.89 13. 83 17.50 27.09 11.29 
ASTGCN 22.93 35.22 16. 56 18.25 28.06 11.64 


STSGCN 21.19 33.65 13. 90 17.13 26.86 10.96 
AGCRN 19.83 32.26 12. 97 15.95 25.22 10.09 
AGC-LSTM 19.30 31.47 12. 66 15.56 25.02 9. 89 


在 PeMSD4 和 PeMSDS 数据 集 上 ,12 个 预测 步 
长 区 间 内 各 步 长 的 预测 性 能 如 图 2~7 所 示 。 从 图 2 一 
7 可 看 出 ,模型 AGC-LSTM 在 12 个 预测 步 长 区 间 ， 
除 第 1 步 长 外 ,在 其 他 步 长 均 具 有 良好 的 预测 性 能 ， 
HE 2 个 数据 集 上 均 表 现 良好 ,能够 更 好 地 平衡 短期 
和 中 长 期 预测 , 即 在 保证 短期 流量 预测 性 能 的 同时 ， 
能 够 提升 一 定 程 度 的 长 期 预测 性 能 , 说 明 AGC- 
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LSTM 的 多 步 预测 能 力 更 强 , 具 有 较 好 的 泛 化 力 。 
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图 2 PeMSD4 数据 集 上 不 同方 法 的 MAE fi 
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PeMSD4 数据 集 上 不 同方 法 的 RMSE 值 
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图 4 PeMSD4 数据 集 上 不 同方 法 的 MAPE 值 
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图 5 PeMSD8 数据 集 上 不 同方 法 的 MAE f 
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图 6 PeMSD8 数据 集 上 不 同方 法 的 RMSE 值 
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图 7 PeMSDS 数据 集 上 不 同方 法 的 MAPE 值 
息 的 能 力 。 以 PeMSDA 数据 集 为 测试 对 象 ,考虑 到 


计算 成 本 ,选择 网 络 模型 层 数 KK 分 别 为 1.2、.3, 且 在 
不 同 K 值 下 ,将 能 入 维度 分 别 设 为 4.6、9、12、15， 


在 AGC-LSTM 中 , 自 适 应 图 卷 积 的 节点 从 入 维 AGC-LSTM Æ 12 步 长 预测 区 间 内 的 平均 MAE fü 
度 是 一 个 重要 参数 ,其 大 小 直接 影响 模型 提取 时 空 信 和 平均 MAPE 值 ( 以 下 实验 都 是 取 各 评估 指标 在 12 
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预测 步 长 区 间 内 的 平均 值 ) 如 图 8 所 示 。 从 图 8 可 看 
出 ,在 不 同 K 值 下 ,嵌入 维度 不 同 ,模型 的 性 能 也 不 
同 ,嵌入 维度 过 大 或 者 过 小 都 会 影响 模型 的 性 能 ,在 
考虑 到 髓 入 维度 越 大 包含 数据 信息 越 多 的 同时 ,也 要 
考虑 到 模型 参数 的 增加 ,从 而 加 大 模型 优化 的 难度 。 
综合 K 值 来 看 , 当 租 入 维度 为 12 时 ,AGC-LSTM 能 
取得 最 佳 性 能 。 
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eN 
P 网 络 层 数 分 析 


SN AGC-LSTM 堆 秋 层 数 对 捕获 交通 数据 的 时 空 


枉 关 性 的 能 力 有 一 定 的 影响 ,但 随 着 网 络 层 数 的 增 
加 G 模 型 参数 .计算 成 本 和 计算 复杂 度 也 会 增加 , 以 
PeMSD4 数据 集 为 测试 对 象 ,考虑 以 上 问题 ,选择 分 
HERA BEBE 12 BITS 1.2.3 Æ AGC-LSTM, 如 图 9 
所 时 .从 图 9 可 看 出 ,模型 堆 释 层 数 不 同 ,预测 性 能 
3 同 , 当 网 络 层 数 为 2 时 ,MAE 值 和 MAPE 值 最 小 ， 
此 时 AGC-LSTM 提取 时 空 相 关 性 的 能 力 相 对 最 强 ， 
具有 最 佳 预测 性 能 。 


MAPE/% 


图 9 网 络 层 数 的 影响 
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2.6 网 络 层 数 分 析 


在 PeMSD4 数据 集 上 , 进一步 评估 了 AGC- 
LSTM 中 自 适 应 图 卷 积 模块 的 性 能 。 使 用 一 般 的 
GCN 来 提取 空间 特征 ,并 以 相同 方式 与 时 间 卷 积 模 
块 相 结合 为 GC-LSTM ,以 共同 提取 时 空 特征 ,再 与 
本 方法 进行 对 比 ,对 比 结果 如 图 10 所 示 。 从 图 10 可 
看 出 ,AGC-LSTM 中 的 自 适应 图 卷 积 模块 能 够 更 好 
地 学 习 特 定 节点 模式 ,可 从 历史 观测 数据 中 获取 足够 
的 空间 特征 信息 ,因此 ,其 预测 性 能 优 于 GC-LSTM。 


35 KS GC-LSTM 
AGC-LSTM 


MAE RMSE MAPE/% 


10 ”网络 模式 对 比 


PR] 


2.7 计算 复杂 度 分 析 


在 PeMSD4 数据 集 上 ，AGC-LSTM 与 
DCRNN, STGCN, ASTGCN, AGCRN 的 参数 量 和 
训练 时 间 如 表 3 所 示 。 从 表 3 可 看 出 ,AGC-LSTM 
的 参数 量 高 于 DCRNN 和 STGCN ,这 是 因为 为 了 更 
好 地 学 习 特 定 节点 模式 ,增加 了 节点 徐 入 维度 ,并 设 
置 为 12。ASTGCN 中 添加 了 时 空 注意 力 机 制 , 以 获 
取 更 精确 的 时 空 特征 ,但 也 增加 了 参数 量 和 训练 时 
间 ,AGCRN 采用 自 适 应 卷 积 递归 算法 ,增加 了 模型 
参数 量 。 当 AGC-LSTM 层 数 为 2 时 ,模型 参数 较 
ASTGCN 和 AGCRN 要 少 , 且 预 测 性 能 也 较 好 , 其 
训练 时 间 略 长 ,这 是 因为 带 有 3 个 卷 积 门 结构 的 时 间 
卷 积 模块 经 过 堆 千 ,在 增强 时 间 信 息 提 取 性 能 的 同 
时 ,增加 了 计算 复杂 度 。 当 AGC-LSTM 层 数 为 1 
时 , 模型 参数 较 DCRNN, STGCN, ASTGCN, 
AGCRN 更 少 ,训练 时 间 与 RMSE 值 也 较 小 。 综 合 
考虑 参数 量 和 预测 精度 ,2 层 AGC-LSTM 的 预测 性 
能 更 佳 ,计算 成 本 适中 。 
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R3 PeMSD4 数据 集 的 计算 复杂 度 


# Training Time 


模型 # Parameters RMSE 
epoch/s 
DCRNN 149 057 46. 47 33. 44 
STGCN 211 596 21. 56 34. 89 
ASTGC 450 031 54. 49 35.22 
AGCRN 748 810 40. 67 32. 26 
AGC-LSTM 
138 096 28. 60 31. 82 
(layers 1) 
AGC-LSTM 
384 624 57. 81 31.47 
(layers 2) 
3 结束 语 
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